import pandas as pd

# 读取JSON文件（假设每行一个JSON对象）
df = pd.read_json('instruction_data.json')

# 转换为Parquet
df.to_parquet('00000-of-00001.parquet', engine='pyarrow')